1. 引言

下载的轨迹数据来源真实,并非特意模拟的轨迹数据,所以质量问题十分严重,进行预处理就显得尤为重要

2. 裁剪

我们将下载的岳麓山轨迹数据加载入QGIS,并使用OSM作为底图:

image.png

可以看到,存在着远超出长沙市范围的数据,这个是显然的必须要去除的

结合实际情况,第一次裁剪范围设置为岳麓山及周边的橘子洲、桃花岭、梅溪湖等,如图:

image.png

对应的分界点坐标为:

由于我们此次的本意(轨迹数据关键词)是岳麓山景区,第二次划分则以岳麓山景区边界为划分依据,如图所示:

image.png

对应的分界点坐标为:

定义MBR

遍历文件夹中的所有文件

对每个文件中的轨迹点进行遍历,包含在MBR中就另存为

以上是对大的范围剪裁,裁减结果如图:

图片.png

以上是对岳麓山进行裁减,结果如图:

图片.png

不妨将裁减的轨迹放入KDE程序中运行,得到KDE图像:

图片.png

看到跳来跳去的线,显然下一步的工作是跳跃点去除

3. 跳跃点去除

前后点之间距离过大视为跳跃点,将这两点切断,该轨迹后面的点设为新的轨迹

定义包含距离计算的实体类:

读取文件:

跳跃点去除:

再运行KDE程序得到图像:

图片.png

看起来似乎好多了

以下是对另一个剪裁进行跳跃点剔除:

4. 关于滞留点

滞留点就是游客停留或者以很慢速度行走的地方,这些地方会造成点聚集,对结果有一定影响,但同时这些点也是重要的点,可以用来挖掘重要区域

5. 关于运动方式

运动方式其实主要是对于游客运动模式的思考,游客主要的运动方式为步行,但也有骑行、驾车、缆车等方式

可以根据速度进行一个划分,根据速度大小进行相应的剔除

考虑到实际情况,一般,景区内车辆能走的道路行人都能走,行人能走的车辆不一定能走

笔者想要的是面向行人的导航地图,所以此处笔者认为可以不处理,另外,在跳跃点剔除那里,由于手机的GPS采样时间有个默认值,我们可以认为对速度过快的也进行了剔除